※注文番号【H1000000XXXXX】は、追跡番号とは異なります。定刊誌・書籍の配送状況は、お問い合わせフォームよりご連絡ください。
価格¥3,600
最先端の音声変換を支える技術について、前提知識から理論と実装まで一気通貫(end−to−end)に解説。《目次》第1章 音声言語情報処理1.1 音声言語情報処理とは何か1.2 人間の音声生成1.3 人間の音知覚1.4 音声言語データの特徴抽出1.5 本章のまとめ第2章 統計的機械学習2.1 音声から何かを学習するということ2.2 統計的機械学習の手引き2.3 分類タスク2.4 回帰タスク2.5 本章のまとめ第3章 ニューラルネットワークの基礎3.1 単純パーセプトロンから多層パーセプトロンへ3.2 多層パーセプトロンからDNNへ3.3 深層生成モデル3.4 本章のまとめ第4章 実践して学ぶ音声言語情報処理4.1 Google ColabolatoryでのPythonプログラミング4.2 多話者音声コーパスのダウンロードと分析4.3 PyTorchでの深層学習実装4.4 本章のまとめ第5章 深層学習に基づく音声変換5.1 音声変換の定義と分類5.2 作って学ぶ深層学習によるパラレル音声変換第6章 リアルタイム音声変換6.1 バッチ音声変換との違い6.2 ピッチ変換型のリアルタイム音声変換6.3 DNNを用いたリアルタイム音声変換6.4 社会生活での実用例6.5 社会への影響6.6 法的な視点第7章 DNNベースの音声変換モデル7.1 VITSの概要と特徴7.2 VITSのアーキテクチャ第8章 日本語におけるリアルタイム音声変換システムの実装8.1 TextEncoderのContentEncoderへの置換8.2 軽量ボコーダへの置換8.3 モデル構造の因果的変更
カートに追加されました。
出版社からのコメント
最先端の音声変換を支える技術について、前提知識から理論と実装まで一気通貫(end−to−end)に解説。《目次》第1章 音声言語情報処理1.1 音声言語情報処理とは何か1.2 人間の音声生成1.3 人間の音知覚1.4 音声言語データの特徴抽出1.5 本章のまとめ第2章 統計的機械学習2.1 音声から何かを学習するということ2.2 統計的機械学習の手引き2.3 分類タスク2.4 回帰タスク2.5 本章のまとめ第3章 ニューラルネットワークの基礎3.1 単純パーセプトロンから多層パーセプトロンへ3.2 多層パーセプトロンからDNNへ3.3 深層生成モデル3.4 本章のまとめ第4章 実践して学ぶ音声言語情報処理4.1 Google ColabolatoryでのPythonプログラミング4.2 多話者音声コーパスのダウンロードと分析4.3 PyTorchでの深層学習実装4.4 本章のまとめ第5章 深層学習に基づく音声変換5.1 音声変換の定義と分類5.2 作って学ぶ深層学習によるパラレル音声変換第6章 リアルタイム音声変換6.1 バッチ音声変換との違い6.2 ピッチ変換型のリアルタイム音声変換6.3 DNNを用いたリアルタイム音声変換6.4 社会生活での実用例6.5 社会への影響6.6 法的な視点第7章 DNNベースの音声変換モデル7.1 VITSの概要と特徴7.2 VITSのアーキテクチャ第8章 日本語におけるリアルタイム音声変換システムの実装8.1 TextEncoderのContentEncoderへの置換8.2 軽量ボコーダへの置換8.3 モデル構造の因果的変更